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Hh 要 : 泪水 流域 是 河 泪 谷地 重要 的 组 成 部 分 
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,协同 环境 因素 预测 土壤 养分 空 
a 
28 个 因子 ,结合 贝 叶 斯 优化 算法 构建 人 工 神 经 网 络 


nd ? 
青海 西宁 810016) 


间 分 布 对 农业 土壤 养 
多 响 和 模型 适用 性 的 研究 较 少 。 


ARN RE 


pu nm 向 Mee dig MA 种 机 器 学 习 模型 预测 耕地 土壤 养分 空间 分 


dg th BR eR BCR’) 、 均 方 根 误差 (RMSE) 和 和 相对 分 


析 误 差 (RPD) 评 价 3 种 模型 的 精度 。 结 果 表 


明 :(1) 基于 贝 叶 斯 优化 超 参数 的 XGBoost 模 型 对 全 氮 (TN) 含 量 预测 精度 优 于 其 他 模型 (R*=0.893， 
RMSE=0.359, RPD=2.470) ,预测 土壤 有 机 质 (SOM) .速效 磷 (AP) 和 速效 钾 (AK) 含 量 时 ,XGBoost # 


A I ik ER’ a) 


Fl 37 0.801 0.509 0.442, (2) 对 比 3 种 模型 的 寻 优 次 数 和 误差 发 现 ,BOA-XGBoost # 
型 参数 优化 次 数 少 、 效 率 高 ,具有 更 好 的 鲁 棒 性 。 对 于 不 同 的 养分 


ANN 和 SVM 模型 预测 精度 存在 


差异 ,SVM 模型 预测 SOM 含量 时 精度 更 高 (RPD=1.580)， neck 预测 TN 时 精度 最 佳 (RPD= 


2.460)。 基 于 贝 叶 斯 算法 进行 超 参 数 优化 构建 的 XGBoost 模 型 预测 精度 高 ,可 以 


效果 ,可 为 渔 水 流域 精准 农业 施肥 提供 和 参考。 
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ERA HLE (SOM) 全 所 (CTN) RECAP) A 
EAK ) 等 养分 是 植被 生长 所 必需 的 ,同时 也 
是 评价 土壤 肥力 水 平 的 重要 指标 。 肥 沃 的 土壤 可 
以 给 作物 提供 丰富 的 营养 物质 促进 作物 生长 ,而 贫 
将 的 土壤 限制 作物 生长 ,进而 影响 到 产量 。 因 此 ， 
对 耕地 土壤 养分 进行 空间 分 布 预测 和 制图 ,是 实现 
可 持续 农业 的 基本 要 求 ” ,同时 也 对 指导 变量 施肥 
和 耕地 土壤 质量 提升 具有 重要 意义 。 

基于 地 统计 学 分 析 和 GIS 技 术 的 养分 含量 空间 
分 布 模拟 精度 取决 于 土壤 样品 采样 密度 ,预测 过 程 
没有 考虑 土壤 养分 空间 分 布 与 环境 因素 和 土壤 自 
身 属性 的 密切 联系 ;传统 土壤 养分 售 量 检测 耗 时 


空间 分 布 ; 环境 因子 ; 
1000 - 6060(2023) 10 - 1643 - 11(1643 ~ 1653) 


达到 良好 的 预测 


涅 水 流域 


大 范围 .高 效率 的 土壤 养分 含量 空间 分 布 监测 ” 
该 技术 在 地 面 少量 实测 数据 的 基础 上 ， 通过 分 析 光 
en 建 反 演 模 型 ,实现 大 
分 含量 空间 分 布 预测 。 目 前 ,已 有 多 种 机 紫 
e aAa 合 遥 感 影像 进行 土壤 养分 空间 分 布 的 
反 演 。 李 冠 稳 等 "以 涅 水 流域 不 同 粒 径 SOM 为 研究 
对 象 ,构建 的 SVM 模型 预测 精度 比 偏 最 小 二 乘 模型 
精度 高 ， 验证 集 相对 分 析 误 差 大 于 2 ,适用 于 涅 水 流 


Sa SOM 含量 预测 ; 雷 浩 川 等 "以 Landsat 遥感 影像 为 
数据 源 ,将 经 过 倒数 处 理 的 波段 反射 率 作 为 模型 自 


变量 ,构建 神经 网 络 模型 反 演 涅 水 流域 大 通 县 TN 
含量 空间 分 布 格局 ,模型 决定 系数 (RR) 为 0.792, 均 


长 且 所 需 费 用 高 ,不 适合 大 范围 养分 含量 空间 分 布 
制图 。 随 着 遥感 技术 的 发 展 ,在 预测 养分 含量 空间 
分 布 和 评估 土壤 肥力 方面 得 到 了 广泛 应 用 ,实现 了 
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Jii 3x23 (RMSE) X 0.246; 此外, 肖 云 飞 和 李 冠 稳 
SOM 含 
量 ,模型 相对 分 析 误 差 (RPD) 分 别 达 到 了 4.229 和 
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4.700。 除 上 述 模型 外 ,极限 学 习 机 Eea 
地 理 加 权 回 归 克 里 格 呈 等 模型 的 预测 精度 较 高 ,在 
土壤 养分 预测 研究 中 得 到 了 广泛 应 用 。 

根据 目前 的 研究 现状 ,线性 和 非 线 性 模型 均 用 
于 土壤 养分 含量 空间 分 布 的 研究 中 ,然而 机 器 学 习 
模型 精度 明显 比 线性 模型 高 ,因此 适合 于 土壤 养分 
反 演 研究 ,可 以 提高 土壤 养分 空间 分 布 预测 的 精度 。 
土壤 养分 空间 分 布 受到 多 种 因素 的 影响 ” ,此 外 ， 
机 需 学 习 模型 参数 设置 会 影响 养分 含量 预测 精度 ， 
而 在 已 有 人 研究 中 模型 参数 的 选择 多 是 经 过 试验 手 
动 调整 而 确定 ,因此 在 参数 选择 上 具有 偶然 性 。 贝 
叶 斯 优化 算法 (BOA) 是 一 种 高 效 的 全 局 智能 优化 算 
法 , 较 其 他 优化 算法 寻求 最 优 解 的 速度 更 快 ,但 基 
于 该 算法 选取 模型 参数 多 见于 土壤 盐分 含量 反 演 
人 研究 中 ,如 杨 练兵 等 "基于 BOA 优化 随机 森林 模型 
参数 反 演 土壤 盐分 ;Wang 等 "使 用 BOA 优化 Light- 
GBM 模 型 ,研究 结果 精度 高 。 然 而 在 土壤 养分 空间 
分 布 研究 中 ,运用 BOA 优化 参数 的 研究 尚 不 多 见 。 
为 此 ,本 文 以 青海 省 涅 水 流域 为 研究 区 ,基于 相关 
性 分 析 选 取 建 模 因 子 ,使 用 Landsat 8 多 光谱 遥感 影 
像 和 野外 实测 耕地 土壤 养分 含量 数据 ,构建 人 工 神 
经 网 络 (ANN) 、 文 持 向 量 机 (SVM) 和 极端 梯度 提升 
(XGBoost )3 种 模型 用 于 耕地 土壤 养分 空间 反 演 ; 利 
用 BOA 选 择 模 型 最 优 超 参 数 ,提高 模型 预测 精度 ， 
构建 适合 涅 水 流域 耕地 养分 空间 预测 的 最 优 模型 ， 
为 指导 变量 施肥 和 精准 农业 有 效 实施 提供 有 利 基 
础 和 技术 支撑 。 


1 研究 区 概况 


涅 水 河 为 黄河 上 游 的 一 级 支流 ,是 黄河 重要 的 
水 源 地 和 生态 屏障 ,同时 也 是 青藏 高 原 和 黄土 高 原 
的 过 渡 带 汪 ”。 涅 水 流域 (36"02'~37"28'N , 100°42'~ 
103*04' E) hii FFF TE ZR JUR ,发源 于 青海 省 海 受 
县 , 流 经 西宁 市 和 海 东 市 ,在 甘肃 省 永 登 县 汇 人 黄 
河 ( 图 1)。 温 水 流域 作为 河 涅 谷地 重要 的 组 成 部 
分 ,在 青海 省 工农 业 发 展 中 占有 主导 位 置 。 涅 水 流 
域 属 于 高 原 大 陆 性 气候 ,海拔 较 高 ,地势 呈 西 高 东 
低 趋 势 , 地 形变 化 较为 复杂 ;流域 内 大 部 分 区 域 为 
于 旱 半 干旱 地 区 ,全 年 干旱 少雨 ,年 平均 气温 低 于 
8%。 流 域内 主要 种 植 春 小 麦 ,油菜 和 青 牺 等 农 
作物 。 


图 例 "m 
^ 采样 点 4874 
O 涅 水 流域 1605 


50 km 


图 1 研究 区 土壤 采样 点 分 布 


Fig. 1 Distribution of soil sampling points in the study area 


2 数据 与 方法 


2.1 土壤 样本 采集 及 数据 来 源 

本 文 综合 考虑 研究 区 地 形 地 势 .采样 难 易 程 度 
和 交通 便利 情况 ,在 2021 年 春耕 前 选取 无 农作物 残 
留 地 或 裸 地 采集 110 个 耕地 土壤 样品 ,同时 利用 手 
FF GPS 接收 机 记录 采样 点 经 纬度 信息 ,并 详细 记录 
采样 点 附近 其 他 环境 信息 ;在 GPS 记 录 点 10 m 直径 
范围 内 ,采集 5 个 耕地 土壤 样品 ,采样 次 度 为 0~20 em, 
最 终 测定 1 个 样 点 养分 含量 的 土壤 样品 由 5 个 位 置 
采集 样品 混合 而 成 。 采 集 的 土壤 样品 经 自然 风干 
去 除 杂 质 、 人 研磨 过 往 后 在 实验 室 测定 SOM , TN. AP 
和 AK 4 种 土壤 养分 含量 及 土壤 pH。 数 据 预 处 理 过 
程 中 ,由 于 异常 值 而 噜 除 3 个 土壤 样品 ,实际 用 于 研 
究 的 耕地 土壤 样品 数 为 107 个 。 

DEM 数据 来 源 于 地 理 空间 数据 云 (https://www. 
gscloud.cn/) ,分 辩 率 为 30 m; Landsat 8 OLI 数 据 来 源 
F USGS (https://earthexplorer.usgs.gov/) ,成 像 时 间 为 
2021 年 4 月 , 云 覆 盖 量 均 小 于 5% ;并 对 获取 的 影像 
进行 大 气 校 正 FE Hie A BY TOA ER VE. AJH Arc- 
GIS 提取 研究 区 坡度 BE Tin] EERE TH 
剖面 曲率 和 地 形 湿度 指数 6 种 地 形 因子 。 

2.2 研究 方法 

本 文 技术 路 线 如 图 2 所 示 。 首 先 基 于 Landsat 8 
影像 和 DEM 数据 提取 土壤 养分 建 模 因子 ,结合 
Pearson 相关 分 析 按 相关 系数 绝对 值 大 小 筛选 
子 。 然 后 构建 ANN SVM XGBoost 3 种 耕地 土壤 养 
分 反 演 模型 ,并 结合 实测 数据 和 建 模 因子 对 模型 参 
数 进行 由 叶 斯 优化 ,对 比 3 种 模型 反 演 精度 ,选取 最 
优 模 型 反 演 滥 水 流域 土壤 养分 含量 空间 分 布 。 
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HE: ANN 为 人 工 神经 网 络 ;SVM 为 支持 向 量 机 ;XGBoost 为 
极端 梯度 提升 ; 尼 为 决定 系数 ;RMSE 为 均 方 根 误差 ; 
RPD 为 相对 分 析 误 差 。 下 同 。 
图 2 养分 反 演技 术 路 线 图 


Fig. 2 Flowchart of the nutrient inversion and analysis 


2.2.1 AIREA ANN 是 模拟 人 脑 神经 网 络 信 息 传 
递 而 提出 的 算法 ,该 模型 通过 网 络 中 神经 元 的 相互 
作用 来 处 理 模 糊 、 非 线性 的 信息 ,在 土壤 养分 反 演 
研究 中 应 用 广泛 。 模 型 由 输入 层 .隐藏 层 和 输出 层 
构成 ,各 层 之 间 由 大 量 神经 元 通过 权重 而 连接 ; 隐 
藏 层 可 以 有 多 层 , 输 入 层 和 输出 层 各 包含 1 层 "…, 输 
入 层 即 为 环境 因子 和 波段 反射 率 , 输 出 层 为 4 种 养 
分 含量 值 。 模 型 最 大 迭代 次 数 .隐藏 层 神经 元 个 数 
以 及 激活 函数 由 BOA 确定 。 

SVM 是 基于 统计 学 理论 提出 的 机 器 学 习 算法 ， 
算法 可 以 很 好 地 解决 小 样本 、 非 线性 问题 ' 引 ,其 核 
心 技 术 在 于 核 函数 的 选择 ,在 解决 实际 问题 时 可 根 
据 研究 问题 的 不 同 合理 选择 核 函 数 。 该 算法 中 共 
有 4 种 核 渔 数 , 分 别 是 多 项 式 核 函 数 、Sigmoid 核 也 
BX 线性 核 函 数 和 径 向 基 屿 数 (RBF) ,在 土壤 测绘 研 
究 中 RBF 是 最 常用 的 核 函 数 收 。 本 文 以 RBF 为 基 
函数 构建 SVM 模型 ,由 BOA 确定 模型 的 惩罚 系数 和 
核 参 数 。 

XGBoost 是 一 种 新 兴 集 成 学 习 算 法 ,算法 核心 
思想 在 于 每 次 迭代 生成 一 棵 树 , 即 学 习 一 个 新 函数 


拟 合 上 次 和 迭代 预测 值 残 差 ,以 生成 的 树 为 基础 ,再 
训练 出 新 的 树 。 该 算法 在 梯度 提升 树 基 础 上 ,保留 
了 更 多 目标 函数 信息 ,提高 了 模型 训练 速度 ,并 在 
目标 函数 中 加 入 正则 项 ,控制 模型 的 复杂 程度 , 降 
低 过 拟 合 现象 的 发 生 呈 2 ,有 效 改进 了 梯度 提升 树 
算法 。 模 型 学 习 率 . 树 的 深度 等 参数 经 BOA 确定 。 

BOA 与 传统 随机 搜索 和 网 格 搜索 算法 相 比 ,该 
算法 会 综合 考虑 已 经 搜索 过 参数 对 模型 的 表现 , 减 
少 优化 迭代 次 数 , 提 高 优化 效率 。 算 法 流程 如 下 : 

(1) 随机 选择 若干 组 参数 x ,添加 数据 训练 模型 
获取 对 应 指标 y; 

(2) 通过 代理 函数 拟 合 x 与 y; 

(3) 使 用 采集 函数 选择 最 佳 参数 组 合 * ; 

(4) 将 x' 代 入 模型 获取 新 的 y, 重 复 第 (2) 步 , 直 
到 最 优 参 数 被 确定 。 
2.2.2 评价 指标 WRK H R, RMSE M RPD 评价 
ANN SVM il XGBoost 3 种 耕地 土壤 养分 反 演 模型 
的 精度 。RMSE 越 小 、R 越 大 ,表示 模型 的 预测 值 与 
养分 实测 值 偏差 小 、 相 关 性 高 ,说明 模 型 预测 精度 
高 ,可 以 更 好 地 反映 研究 区 耕地 土壤 养分 含量 的 空 
间 分 布 特征 ; 当 模 型 RPD>2 时 预测 精度 高 ,1.4< 
RPD<2 时 预测 精度 较 好 ,RPD<1.4 时 预测 精度 低 。 
精度 评价 指标 计算 公式 如 下 : 


(1) 


(2) 


SD 
RMSE (3) 


式 中 :为 采集 土壤 样本 总 数 ;y 为 养分 含量 实测 值 ; 
诱 为 模型 预测 养分 含量 值 ;7 为 养分 平均 值 ;SD 为 验 
证 集 标准 差 。 


3 结果 与 分 析 


3.1 土壤 养分 含量 常规 统计 分 析 

由 涅 水 流域 土壤 养分 描述 性 统计 分 析 结 果 可 
知 ( 表 1), 涅 水 流域 SOM 含 量 介 于 4.310~59.789 oko", 
TN E BS F 0.372~5.874 g- kg 之 间 ,AP 含 量 介 于 
0.001-0.162 gkg 之 间 ,AK 含 量 介 于 0.048~0.488 g .kg 
之 间 ;SOMTN AP 和 AK 平 均 含量 分 别 为 28.377 grkg, 


RPD = 


X 2 ER 
1646 FAEWY 46% 
表 1 涅 水 流域 土壤 养分 常规 统计 分 析 结果 
Tab. 1 Routine statistical analysis results of soil nutrients in the Huangshui River Basin 
土壤 养分 样 点 数 /个 最 小 值 /g* kg” 最 大 值 /g: kg" 平均 值 /gkg” 标准 差 /gkg” 变异 系数 /% 

SOM 107 4.310 59.789 28.377 11.168 39.356 
TN 107 0.372 5.874 1.232 0.856 69.481 
AP 107 0.001 0.162 0.055 0.032 58.182 
AK 107 0.048 0.488 0.204 0.087 42.647 


注 :SOM .TN AP 和 AK 分 别 为 土壤 有 机 质 、 全 所 ERAEN 


1.232 g.kg ,0.055 g- kg! 410.204 g.kg'。 变 异 系数 
用 来 反映 土壤 养分 含量 的 离散 程度 ,经 统计 分 析 
后 ,4 种 土壤 养分 的 变异 系数 分 别 为 39.356% 、 
69.481% 、58.182% 和 42.647% ,4 种 养分 均 处 于 中 等 
32 土壤 养分 与 地 形 因 子 、 波 段 反 射 率 相 关 性 分 析 
VJ Landsat 8 影像 波段 原始 反射 率 (b1~b7) 、 经 
过 数学 变换 的 反射 率 ( 对 数 和 倒数 处 理 ) .6 种 地 形 
因子 及 土壤 pH, 共 计 28 个 因子 作为 模型 的 输入 变 
量 。 由 环境 变量 与 4 种 耕地 土壤 养分 含量 Pearson 
相关 性 分 析 结果 ( 表 2) 可 见 ,研究 区 SOM 含量 与 高 
程 和 土壤 pH 值 哇 极 显 著 相 关 关系 (P<0.01) ,说 明 区 
域 的 海拔 越 高 pH 值 越 小 ,SOM 的 含量 越 高 ;SOM 


表 2 土壤 养分 与 环 


Pla]. 


含量 与 坡 向 .剖面 曲率 、 地 形 湿度 指数 .地形 起 伏 度 
之 间 呈 显著 相关 性 (P<0.05) ,而 与 坡度 和 平面 曲率 
相关 性 不 高 ;TN 与 SOM 的 相关 性 较 高 ,都 与 环境 因 
子 呈 现 相 似 的 相关 性 ,研究 区 海拔 较 高 地 区 SOM 和 
TN 含 量 较 高 ;AP 与 研究 区 坡 向 .平面 曲率 和 地 形 起 
伏 度 之 间 呈 现 显 著 相 关 关系 ,与 其 他 因子 的 相关 性 
不 显著 ; 当地 形 的 起 伏 变 化 越 大 ,研究 区 的 AP 含量 
就 越 低 ; AK 与 坡度 .pH 呈现 显著 负 相关 性 ,坡度 越 
大 .土壤 酸性 越 弱 ,研究 区 AK 含 量 越 低 , 这 与 Komo- 
lafe E ^ 和 代 子 俊 ” 的 研究 结果 一 致 。 

由 耕地 土壤 养分 含量 和 反射 率 Pearson 相关 分 
析 结 果 ( 表 3) 可 见 ,SOM 和 原始 波段 都 呈现 相关 关 
系 , 而 且 相 比 原始 波段 反射 率 , 经 过 数学 变换 处 理 
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Tab. 2 Correlation analysis between soil nutrients and environmental variables 


土壤 养分 高 程 坡 向 坡度 平面 曲率 剖面 曲率 地 形 湿度 指数 ”地 形 起 伏 度 pH 
SOM 0.422" 0.223' -0.022 0.101 0.052" 0.010' 0.095 -0.338^ 
TN 0.595" 0.238 -0.174 -0.015 0.089" 0.052° 0.276" -0.485" 
AP -0.048 —0.066' -0.028 0.080 -0.036 -0.048 —0.098' 0.026 
AK 0.052 0.041 -0.080' 0.029 0.015 -0.015 -0.013 -0.106" 
注 :**、* 分 别 表示 在 P<0.01、P<0.05 水 平 上 显著 。 下 同 。 


表 3 土壤 养分 与 波段 反射 率 之 间 的 相关 性 分 析 
Tab.3 Correlation analysis between soil nutrients and band reflectance 
波段 SOM TN AP AK 波段 SOM TN AP AK 

bl -0.390™ -0.343" 0.118 -0.039 lg5 -0.283" -0.158 0.088 —0.034 
b2 -0.391" -0.334" 0.108 —0.040 lg6 -0.259" —-0.185 0.082 -0.125' 
b3 -0.393" -0.311" 0.083 -0.070 lg7 -0.251" -0.24T 0.069 -0.169° 
b4 -0.379” -0.280" 0.085 -0.084 1/b1 0.278” 0.424" —-0.134 0.046 
b5 -0.267" -0.084 0.068 -0.041 1/b2 0.334" 0.485” -0.151 0.034 
b6 -0.194 -0.018 0.033 -0.120 1/b3 0.376" 0.4917 -0.142" 0.044 
b7 -0.174 -0.073 0.008 -0.180° 1/b4 0.385" 0.489" -0.143° 0.063 
lgl -0.387" -0.495" 0.150° -0.024 1/b5 0.300" 0.247 -0.112 0.029 
lg2 -0.392” -0.452" 0.139 -0.019 1/b6 0.3177 0.361” —0.128 0.119 
lg3 -0.394 -0.407" 0.113 -0.051 1/b7 0.316" 0.422” —0.126 0.139 
lg4 -0.387" -0.386" 0.114 -0.071 


注 :b1~b7 为 波段 原始 反射 率 ;lg1~lg7 为 经 对 数 处 理 的 反射 率 ; 1/6 11/67 为 经 倒数 处 理 的 反射 率 。 下 同 。 
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之 后 的 反射 率 与 SOM 的 相关 性 提高 ,如 p5 原 始 反射 
率 与 SOM 的 相关 系数 (>)=-0.267, 经 过 倒数 处 理 之 
后 ,r=0.300;TN 与 波段 反射 率 相关 性 与 SOM 一 致 ， 
TN Fi lgl 的 相关 性 最 高 (r=-0.495) ; 总体 而 言 AP 和 
AK 与 反射 率 的 相关 关系 极 低 ,只 有 个 别 波段 通过 
显著 性 检验 P<0.05, 如 1/b2 F AP Z [E] t 3 5 EH 
XX (r=-0.151, P«0.05) , AK 与 lg7 相 关 关 系 最 佳 
(r2-0.169, P«0.05) 
3.3 反 演 模型 构建 及 优化 

土壤 养分 空间 分 布 受到 人 为 因素 (施肥 灌流 
等 ) 和 自然 因素 (地 形 .土壤 类 型 等 ) 的 共同 影响 3*， 
建 模 因子 的 选取 影响 反 演 模型 预测 精度 ,因此 在 兼 
顾 研 究 区 地 形 .影像 波段 原始 反射 率 及 数学 变换 反 
射 率 3 类 因子 的 前 提 下 ,依据 相关 性 分 析 结 果 以 及 
研究 区 特点 ,优先 选取 与 4 种 耕地 土壤 养分 呈现 极 
显著 相关 关系 的 环境 因子 .原始 反射 率 和 经 过 数学 
变换 之 后 的 反射 率 作 为 建 模 因子 。 为 避免 选取 的 
建 模 因子 集中 在 同一 类 ,通过 分 段 极 大 值 法 选取 各 
养分 建 模 因子 , 即 从 上 述 的 3 类 因子 中 选 相 关 性 高 
的 因子 作为 该 养分 反 演 模型 的 建 模 因子 ,由 于 养分 
含量 及 养分 自身 性 质 与 3 类 因子 的 相关 性 不 同 , 建 
模 因 子 的 选取 存在 差异 。 各 土壤 养分 建 模 因子 选 
取 结 果 如 表 4 所 示 。 


表 4 土壤 养分 建 模 因 子 
Tab.4 Soil nutrient modeling factors 
养分 建 模 因子 
SOM AE E pH 地形 起 伏 度 lg3 1/b4 
TN 高 程 . 坡 向 .剖面 曲率 、 地 形 起 伏 度 .土壤 pH lgl 、1/b3 
AP 坡 向 .平面 曲率 ` 地 形 起 伏 度 Mel 1/b2. 
AK 坡度 .地 形 湿度 指数 .土壤 pH、b7 


利用 上 述 建 模 因 子 和 实测 耕地 养分 含量 数据 ， 
构建 反 演 模型 ,并 基于 BOA 对 模型 参数 进行 优化 ， 
选取 最 优 的 参数 组 合 使 得 模型 预测 误差 最 小 。 随 
着 优化 次 数 的 增加 ,模型 误差 趋 于 稳定 ,此 时 模型 
各 参数 值 即 为 最 优 参数 组 合 。 通 过 比较 3 种 模型 的 
优化 迭代 次 数 以 及 模型 预测 误差 (图 3) ,发 现 BOA- 
XCBoost 模 型 寻找 最 优 参数 组 合 所 需 的 优化 次 数 最 
> , BOA-ANN 模型 最 终 预测 土壤 养分 空间 分 布 的 误 
差 较 大 。 


« ES ái. 一 一 一 - BOA-XGBoost 


模型 误差 


~ 0 40 80 120 
优化 次 数 /次 


注 :BOA-ANN .BOA-SVM 和 BOA-XGBoost 分 别 为 经 贝 叶 斯 优化 的 
人 工 神经 网 络 支持 向 量 机 和 极端 梯度 提升 。 
图 3 模型 优化 结果 


Fig. 3 Model optimization results 


贝 叶 斯 优化 模型 参数 过 程 中 ,采用 5 折 交 叉 验 
证 法 确定 机 带 学 习 模型 最 终 的 参数 值 , 经 贝 叶 斯 优 
化 3 种 模型 的 最 优 参 数组 合 如 表 5 所 示 。 
3.4 模型 精度 比较 

基于 模型 最 优 超 参 数值 ,随机 选取 70% 的 样本 
分 别 构 建 反 演 模型 ,并 以 剩余 样本 对 模型 进行 验 


表 5 3 种 模型 最 优 超 参 数组 合 


Tab. 5 Optimal hyperparametric combination of the three models 


模型 参数 SE rug 
SOM TN AP AK 

ANN 隐藏 层 节点 /个 80 100 120 120 
BATE UR BIR 1000 1500 500 500 
激活 函数 S 型 函数 S 型 函数 修正 线性 单元 函数 修正 线性 单元 函数 

SVM 惩罚 系数 3.12 2.50 0.35 1.10 
核 参数 0.42 0.73 0.91 0.92 

XGBoost 树 的 最 大 深度 4 5 4 4 
最 大 树 数 目 50 30 75 96 
学 习 率 0.03 0.07 0.05 0.04 
最 小 叶 节 点 样本 权重 和 4 4 2 1 


TE: ANN SVM .XGBoost 分 别 为 人 工 神经 网 络 ,支持 向 量 机 、 极 端 梯度 提升 。 下 同 。 
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证 ,选取 最 优 反 演 模型 用 于 涅 水 流域 耕地 土壤 养分 
空间 预测 。 表 6 为 各 模型 预测 精度 比较 ,可 以 看 出 ， 
XGBoost 模型 反 演 精度 明显 高 于 ANN 和 SVM 模 
型 。SOM All TN 验证 集 尼 分 别 为 0.801 .0.893,RPD 
均 大 于 2, 具 有 较 高 的 预测 精度 ,与 ANN 模型 预测 
SOM 和 TN 时 相 比 ,RR 分 别提 高 了 0.158、0.090; 而 与 
SVM 模型 相 比 , 尼 分 别提 高 了 0.169 .0.158; 对 于 AP 
和 AK 的 预测 ,3 种 模型 验证 集 尼 均 不 高 ,但 相 比 于 
其 他 模型 ,XGBoost 模 型 的 让 仍然 最 大 ,RMSE 最 小 ， 
精度 显著 优 于 ANN 和 SVM 模型 。 
3.5 土壤 养分 空间 预测 

基于 反 演 模型 对 4 种 耕地 土壤 养分 进行 空间 预 
测 ,并 绘制 空间 预测 分 布 图 (图 4)。 从 预测 图 中 可 
以 看 出 ,不同 模型 对 于 相同 养分 含量 的 反 演 存在 差 
异 ;SOM 和 TN 之 间 相 关 性 高 ,空间 分 布 总 体 变 化 趋 
势 相 似 , 即 西北 分 布 含量 高 ,东南 部 含量 较 低 ;利用 
XGBoost 模 型 反 演 研究 区 SOM 含 量 在 7.91~55.74 g*kg” 
之 间 , 而 TN 含量 反 演 最 低 值 为 0.42 g'kg ', 最 高 值 
为 5.14 g*kg'; AP FIAK 总 体 含量 较 低 , 其 空间 分 
布 变 化 不 明显 ,而 晶 AP 和 AK 含 量 之 间 呈 现 负 相关 
性 ,AP 含量 越 高 , 则 AK 含 量 越 低 。XGBoost 模型 预 
iJ AP 含量 范围 为 0.04~0.11 g: kg', 而 AK 含 量 范围 
为 0.07~0.42 gkg'。 综 上 所 述 ,XGBoost 模 型 反 演 
值 更 接近 实测 数据 范围 ,基本 可 以 反 演 出 研究 区 实 
际 耕 地 土壤 养分 含量 的 空间 分 布 状 态 。 

土壤 养分 的 分 布 具 有 空间 自 相关 性 和 异 质 性 **”。 
以 SOM 为 例 , 选 取 子 区 域 绘制 SOM 局 部 空间 分 布 特 


征 (图 5) ,来 比较 3 种 模型 的 适用 性 。 发 现 3 种 模型 
对 SOM 空 间 分 布 特征 反 演 存在 较 大 的 差异 ;对 比 真 
彩色 合成 遥感 影像 ,XGBoost 模 型 预测 SOM 分 布 细 
节 更 清晰 ,能 更 好 反映 SOM 空 间 分 布 。 


4 讨论 


XGBoost 模型 是 一 种 具有 训练 速度 快 、 拟 合 精 
度 高 的 新 兴 集 成 学 习 算法 ,在 盐分 含量 反 演 2 AR 
小 麦 全 氮 含 量 反 演 2 等 领域 得 到 了 很 好 的 应 用 ,而 
在 土壤 养分 反 演 人 研究 中 应 用 较 少 。 本 研究 利用 
BOA-XGBoost 模型 反 演 耕地 土壤 养分 含量 ,分 析 了 
XGBoost 模型 在 涅 水 流域 耕地 土壤 养分 反 演 中 的 适 
用 性 。 研 究 发 现 不 同 算法 对 同一 养分 的 建 模 效 果 
不 同 , 其 中 XGBoost 模 型 的 预测 精度 最 高 ;SVM 和 
ANN 2 种 模型 对 于 不 同 的 养分 ,其 预测 精度 存在 差 
异 , 前 者 预测 SOM 时 精度 高 (RPD=1.580) ,后 者 则 对 
TN 预测 效果 好 (RPD=2.460)。 其 他 学 者 也 采用 不 
同 的 方法 对 洗 水 流域 养分 进行 佑 测 , 如 胡 亚 男 等 ™ 
构建 PLSR 模型 预测 涅 水 流域 SOM ,模型 验证 集 尼 = 
0.690 .RPD=1.820, 其 精度 低 于 本 文中 XGBoost 模 型 
的 精度 (R=0.801, RMSE=4.321, RPD=2.152) ; 张 欢 
等 (中 基于 地 统计 学 方法 模拟 SOM 含 量 、 刘 尊 方 等 
以 空间 插值 方法 绘制 的 涅 水 流域 SOM 含量 空间 分 
布 趋势 与 本 文 构建 的 最 优 模 型 反 演 得 到 的 空间 分 
布 一 致 。 空 间 捅 值 方法 得 到 的 养分 空间 分 布 在 细 
节 上 得 不 到 体现 ,遥感 技术 结合 机 器 学 习 方 法 可 以 


表 6 不 同 养分 反 演 模型 精度 比较 


Tab. 6 Precision comparison of different nutrient inversion models 


LHDRAY 模型 建 模 集 验证 集 
R RMSE R RMSE RPD 
SOM ANN 0.753 5.363 0.643 7.401 1.214 
SVM 0.822 5.122 0.632 5.648 1.580 
XGBoost 0.910 3.791 0.801 4.321 2.152 
TN ANN 0.885 0.245 0.803 0.306 2.460 
SVM 0.871 0.415 0.735 0.252 1.886 
XGBoost 0.958 0.235 0.893 0.359 2.470 
AP ANN 0.491 0.040 0.382 0.030 1.002 
SVM 0.468 0.023 0.441 0.029 1.213 
XGBoost 0.692 0.022 0.509 0.026 1.210 
AK ANN 0.514 0.063 0.419 0.064 1.321 
SVM 0.486 0.061 0.354 0.072 1.260 
XGBoost 0.692 0.043 0.442 0.055 1.274 


TE: R RMSE RPD 分别 为 决定 系数 , 均 方 根 误差 ,相对 分 析 误差 。 下 同 。 
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注 :SOM ,TN .AP 和 AK 分 别 为 土壤 有 机 质 、 全 气 IE EC o 
4 3 种 模型 反 演 的 土壤 养分 空间 分 布 
Fig.4 Spatial distributions of soil nutrients by three models 


弥补 这 一 缺点 ,但 其 反 演 精度 取决 于 影像 的 空间 分 
pg", 

已 有 研究 表明 , 仅 通 过 环境 变量 预测 土壤 养分 
含量 时 精度 较 低 ,而 基于 遥感 影像 波段 反射 率 构 
建 模型 时 ,又 忽略 了 环境 因素 对 养分 含量 空间 分 布 
的 影响 , 反 演 结果 不 可 笔 。 张 欢 等 ”的 研究 发 现 涅 
水 流域 SOM 空 间 分 布 受到 地 形 .土壤 类 型 土地 利 
用 类 型 和 施肥 等 多 方面 的 影响 。 本 文 也 分 析 了 养 


分 和 环境 因子 之 间 的 相关 性 ,发 现 高 程 . 坡 向 、 地 形 
起 伏 度 是 影响 养分 空间 分 布 的 主要 因素 。Liu 等 “ 
仅 通 过 多 光谱 波段 反射 率 构建 TN 反 演 模型 ,忽略 
了 环境 因子 的 影响 ,模型 精度 较 低 (人 R=0.676); 李 莹 
莹 等 ”的 研究 在 反射 率 基 础 上 加 入 环境 因子 之 后 ， 
模型 预测 精度 提高 。 在 选取 特征 波段 时 ,可 对 原始 
光谱 反射 率 进行 数学 变换 ,这 样 可 以 有 效 提高 反射 
率 与 土壤 养分 之 间 的 相关 性 ,有 利于 建立 精度 更 高 
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(a) RGB 真 彩色 合成 遥感 影像 
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图 5 SOM 局 部 空间 分 布 特征 
Fig. 5 Local spatial distribution characteristics of SOM 


的 反 演 模型 ,本文 对 Landsat 8 原始 影像 b3 RI RA 
倒数 处 理 之 后 ,相关 系数 由 原来 的 -0.311 提高 到 
0.491 ,相关 系数 绝对 值 提 高 了 57.88% ; 孙 铭 岳 ” 基 
于 多 源 和 遥感 数据 反 演 SOM 和 盐分 的 研究 中 ,也 表明 
经 过 数学 变换 之 后 的 反射 率 与 有 机 质 的 相关 性 高 ， 
杜 军 等 2 的 研究 也 得 到 类 似 的 结果 。 

众多 因素 共同 决定 着 土壤 养分 的 空间 分 布 ,而 
本 文选 取 的 辅助 因子 有 限 , 今 后 工作 将 侧重 于 环境 
和 人 为 因子 协同 条 件 下 土壤 养分 的 空间 反 演 ,以 及 
其 他 优化 算法 对 模型 参数 选择 的 优 缺 点 ;为 准确 预 
测 微量 养分 含量 空间 分 布 ,考虑 选择 高 光谱 遥感 影 
像 数 据 以 提取 与 养分 显著 相关 的 波段 ,提高 预测 能 
力 , 为 涅 水 流域 精准 农业 施肥 提供 参考 。 


5 结论 


sd 


(1) 涅 水 流域 土壤 有 机 质 (SOM) AR ARCCTN ) E 
效 磷 (AP) 和 速效 钾 (AK)4 种 养分 均 处 于 中 等 变异 
程度 ,其 中 TN 的 变异 程度 最 大 (69.481% ) ;4 种 养分 
的 含量 均 在 中 等 水 平 。 

(2) 结合 涅 水 流域 6 种 环境 因子 .波段 反射 率 
和 衍生 反射 率 构建 反 演 模型 ,比较 ANN SVM 和 
XGBoost 3 种 机 需 学 习 模 型 的 预测 精度 ,发 现 ANN 
和 SVM 模型 的 预测 能 力 较 低 ,XCBoost 模 型 预测 TN 
含量 精度 最 高 (R*=0.893,RMSE=0.359,RPD=2.470)， 
反 演 SOM 含 量 空间 分 布 精度 次 之 ,验证 集 尼 =0.801， 
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RMSE-4.321, RPD-2.152, f? 
空间 分 布 趋势 保持 一 
Hoppe 


刘 伍 方 等 基于 XGBoost 模 型 的 涅 水 流域 


发 绘制 的 SOM 和 TN 
致 ,总 体 呈 现 西 北 高 东南 低 ， 


量 较 低 ;AP 和 AK 含 量 较 低 ,变化 趋势 不 


明显 。 


模型 反 演 涅 水 流域 土壤 养分 
可 以 很 好 地 体现 土壤 养分 局 部 分 布 


(3) 相 比 ANN 和 SVM 模 型 , 贝 叶 斯 优化 XGBoost 
空间 分 布 格局 精度 高 ， 
SEE ,更 适合 应 


用 于 土壤 养分 反 演 人 研究 中 。 
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Remote sensing inversion of soil nutrient on farmland in Huangshui 
River Basin based on XGBoost model 


LIU Zunfang, LEI Haochuan, SHENG Haiyan’? 
(1. Department of Geological Engineering, Qinghai University, Xining 810016, Qinghai, China; 
2. College of Agriculture and Animal Husbandry, Qinghai University, Xining 810016, Qinghai, China) 


Abstract: The Huangshui River Basin is an important part of the Huangshui Valley. Additionally, collaborative 
environmental factors that predict the spatial distribution of soil nutrients are particularly important for managing 
soil nutrients. Moreover, less attention is paid to the effect of model parameters on the results obtained from soil 
nutrient inversion studies. In this study, the Huangshui River Basin in Qinghai Province (China) was selected as 
the study area, and 28 factors, including elevation, aspect, slope, plane curvature, section curvature, relief degree 
of land surface, topographic wetness index, soil pH, and spectral reflectance, were selected. In addition, these fac- 
tors were combined with the Bayesian optimization algorithm (BOA) to construct artificial neural network 
(ANN), support vector machine (SVM), and extreme gradient boosting (XGBoost) machine learning models for 
predicting the spatial distribution of four soil nutrients in farmlands: soil organic matter (SOM), total nitrogen 
(TN), available phosphorus (AP), and available potassium (AK), respectively. Further, the prediction accuracy of 
these three models was evaluated based on the model coefficient of determination (R^), root- mean-square error 
(RMSE), and relative percent deviation (RPD). The results revealed that: (1) All four soil nutrients exhibited a 
moderate degree of variability, with TN showing the highest variability of 69.481965. The XGBoost model based 
on the Bayesian optimized hyperparameter combination was better than other models in predicting the TN con- 
tent (R’, RMSE, and RPD were 0.893, 0.359, and 2.470, respectively). The R’ values of the XGBoost model vali- 
dation set for estimating the SOM, AK, and AP contents were 0.801, 0.509, and 0.442, respectively, and the corre- 
sponding RPD values were 2.152, 1.210, and 1.274, respectively. Moreover, this model exhibited a better predic- 
tion capability. (2) The comparison of the number of optimizations and errors of the three models revealed that 
the BOA- XGBoost model exhibited minimum number of parameter optimizations, higher efficiency, and better 
robustness. The ANN and SVM models demonstrated different prediction accuracies for different nutrients; addi- 
tionally, the SVM model predicted the SOM content with high accuracy (RPD=1.580), while the ANN model pre- 
dicted TN efficiently (RPD-2.460). Based on Landsat 8 remote sensing images, the XGBoost inversion model de- 
veloped by combining 28 factors of the Huangshui River Basin was found to be more suitable for application in 
soil nutrient inversion research; furthermore, it can more accurately describe the spatial distribution pattern of the 
soil nutrient inversion in the Huangshui River Basin, better ensure precise agriculture fertilization, improve the 
fertilizer utilization rate and crop yield, and provide a reference for precise agriculture fertilization in the 
Huangshui River Basin. 


Key words: soil nutrient; XGBoost; spatial distribution; environmental factor; Huangshui River Basin 


